今回利用する新型コロナウィルスに関するデータは以下から任意に選択してください。すべてオンラインにてデータが取得できます。
| データ名 | 区分 | 種別 | ダウンロード | 備考 |
|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | 可 | 項目単位で集計したものを個別ファイルで公開 |
| JAG Japan | 公開 | 個別 | 可 | GIS処理用データ付き |
| Covid19japan.com | 公開 | 個別 | 可 | GitHubにてJSON形式で公開 |
その他、任意のデータを用いても構いませんがデータの出典と説明を記述しておいてください。
今回利用する新型コロナウィルスに関するデータは以下から任意に選択してください。すべてオンラインにてデータが取得できます。
| データ名 | 区分 | 種別 | ダウンロード | 備考 |
|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | 可 | 項目単位で集計したものを個別ファイルで公開 |
| JAG Japan | 公開 | 個別 | 可 | GIS処理用データ付き |
| Covid19japan.com | 公開 | 個別 | 可 | GitHubにてJSON形式で公開 |
その他、任意のデータを用いても構いませんがデータの出典と説明を記述しておいてください。
厚生労働省のデータは各報告日時点の集計値が個別ファイルになっていますので、意味を把握してから分析してください。
| データ名 | 概要 |
|---|---|
| 陽性者数 | 新規に陽性と判断された者の数(除く空港検疫) |
| PCR検査実施人数 | 当日と前日の累積人数の差(除く空港検疫) |
| 入院治療等を要する者の数 | 入院待機中・確認中を除く(除く空港検疫) |
| 退院又は治療解除となった者の数 | (除く空港検疫) |
| 死亡者数 | (除く空港検疫) |
| PCR検査の実施件数 | 暫定数値であり後日変更される可能性あり |
特徴的なのはW列(23列)目以降にGIS処理用の変量(フィーチャー)が用意されている点です。これらの変量は分析には必要ありませんので、削除しておくことをおすゝめします。また、インスタンスには多数の揺れが含まれている点に注意してください。
なお、読み込み時は以下のオプションを指定しないとWinodws環境ではエラーになります。
readr::read_csv(locale = readr::locale(encoding = "UTF-8"), guess_max = 5000)
各列(変量)の定義は こちら で公開されています。
GitHub からjsonliteパッケージを利用して以下のコードで読み込んでください。readr::read_csv関数では正しく読み込めません。
library(jsonlite)
path <- "https://raw.githubusercontent.com/reustle/covid19japan-data/master/"
path <- paste0(path, "docs/patient_data/")
path %>%
paste0("latest.json") %>%
readr::read_lines() %>%
paste0(path, .) %>%
jsonlite::fromJSON()
pathの2行は表示用に分割しています。また、JAG Japanのデータと同様に揺れがあります。
tidyverseパッケージを必ずインストールしておいてください
readrならびにjsonliteパッケージはtidyverseパッケージに含まれますreadr::read_csv関数を用います
localeオプションを指定してください| 地方区分 | 含まれる都道府県 |
|---|---|
| 北海道 | 北海道 |
| 東北 | 青森県・岩手県・秋田県・宮城県・山形県・福島県 |
| 関東 | 茨城県・栃木県・群馬県・埼玉県・千葉県・東京都・神奈川県 |
| 中部 | 山梨県・長野県・新潟県・富山県・石川県・福井県・静岡県・愛知県・岐阜県 |
| 近畿 | 三重県・滋賀県・京都府・大阪府・兵庫県・奈良県・和歌山県 |
| 中国 | 鳥取県・島根県・岡山県・広島県・山口県 |
| 四国 | 香川県・愛媛県・徳島県・高知県 |
| 九州 | 福岡県・佐賀県・長崎県・熊本県・大分県・宮崎県・鹿児島県・沖縄県 |